PGroongaで"too long sentence"と怒られた
これはMeCabが何らかの理由で文に区切れずに1文が長くなりすぎるのが原因 code:log
tokenizermecab mecab_parse_lattice() failed len=3201813 err=too long sentence. この場合、オプションで"chunked_tokenize", trueすれば強制的に区切ってチャンク化してくれるのでエラーが発生しない
code:sql
CREATE INDEX index_name
ON table
USING pgroonga (col)
WITH (tokenizer='TokenMecab("chunked_tokenize", true)');